7.7 基本矩阵
线性微分方程组 的解 的结构 可以通过引入基本矩阵 的概念 来进一步阐明。假设 x ( 1 ) ( t ) , … , x ( n ) ( t ) \mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t) x ( 1 ) ( t ) , … , x ( n ) ( t ) 构成方程
x ′ = P ( t ) x \begin{equation*}
\mathbf{x}^{\prime}=\mathbf{P}(t) \mathbf{x} \tag{1}
\end{equation*}
x ′ = P ( t ) x ( 1 )
在某个区间 α < t < β \alpha<t<\beta α < t < β 上的一个基本解集 。那么矩阵
Ψ ( t ) = ( x ( 1 ) ( t ) ∣ x ( 2 ) ( t ) ∣ ⋯ ∣ x ( n ) ( t ) ) = ( x 1 ( 1 ) ( t ) ⋯ x 1 ( n ) ( t ) ⋮ ⋮ x n ( 1 ) ( t ) ⋯ x n ( n ) ( t ) ) (2) \Psi(t)=\left(\mathbf{x}^{(1)}(t)\left|\mathbf{x}^{(2)}(t)\right| \cdots \mid \mathbf{x}^{(n)}(t)\right)=\left(\begin{array}{lll}
x_{1}^{(1)}(t) & \cdots & x_{1}^{(n)}(t) \tag{2}\\
\vdots & & \vdots \\
x_{n}^{(1)}(t) & \cdots & x_{n}^{(n)}(t)
\end{array}\right)
Ψ ( t ) = ( x ( 1 ) ( t ) x ( 2 ) ( t ) ⋯ ∣ x ( n ) ( t ) ) = x 1 ( 1 ) ( t ) ⋮ x n ( 1 ) ( t ) ⋯ ⋯ x 1 ( n ) ( t ) ⋮ x n ( n ) ( t ) ( 2 )
其列向量 为 x ( 1 ) ( t ) , … , x ( n ) ( t ) \mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t) x ( 1 ) ( t ) , … , x ( n ) ( t ) ,被称为系统 (1) 的一个基本矩阵 。注意,一个基本矩阵 是非奇异 的,因为它的列 是线性无关 的向量 。
示例 1
求系统
x ′ = ( 1 1 4 1 ) x (3) \mathbf{x}^{\prime}=\left(\begin{array}{ll}
1 & 1 \tag{3}\\
4 & 1
\end{array}\right) \mathbf{x}
x ′ = ( 1 4 1 1 ) x ( 3 )
的一个基本矩阵fundamental matrix 。
解 :
在 7.5 节 的示例 2 中,我们发现
x ( 1 ) ( t ) = ( e 3 t 2 e 3 t ) , x ( 2 ) ( t ) = ( e − t − 2 e − t ) \mathbf{x}^{(1)}(t)=\binom{e^{3 t}}{2 e^{3 t}}, \quad \mathbf{x}^{(2)}(t)=\binom{e^{-t}}{-2 e^{-t}}
x ( 1 ) ( t ) = ( 2 e 3 t e 3 t ) , x ( 2 ) ( t ) = ( − 2 e − t e − t )
是方程 (3) 的线性无关解 。因此,系统 (3) 的一个基本矩阵 是
Ψ ( t ) = ( e 3 t e − t 2 e 3 t − 2 e − t ) (4) \boldsymbol{\Psi}(t)=\left(\begin{array}{rr}
e^{3 t} & e^{-t} \tag{4}\\
2 e^{3 t} & -2 e^{-t}
\end{array}\right)
Ψ ( t ) = ( e 3 t 2 e 3 t e − t − 2 e − t ) ( 4 )
初始值问题 的解 可以用基本矩阵 非常紧凑地写出。方程 (1) 的通解 是
x = c 1 x ( 1 ) ( t ) + ⋯ + c n x ( n ) ( t ) \begin{equation*}
\mathbf{x}=c_{1} \mathbf{x}^{(1)}(t)+\cdots+c_{n} \mathbf{x}^{(n)}(t) \tag{5}
\end{equation*}
x = c 1 x ( 1 ) ( t ) + ⋯ + c n x ( n ) ( t ) ( 5 )
或者,用 Ψ ( t ) \boldsymbol{\Psi}(t) Ψ ( t ) 表示,
x = Ψ ( t ) c \begin{equation*}
\mathbf{x}=\mathbf{\Psi}(t) \mathbf{c} \tag{6}
\end{equation*}
x = Ψ ( t ) c ( 6 )
其中 c \mathbf{c} c 是一个具有任意分量 c 1 , … , c n c_{1}, \ldots, c_{n} c 1 , … , c n 的常数向量 。对于一个由微分方程 (1) 和初始条件
x ( t 0 ) = x 0 \begin{equation*}
\mathbf{x}\left(t_{0}\right)=\mathbf{x}^{0} \tag{7}
\end{equation*}
x ( t 0 ) = x 0 ( 7 )
组成的初始值问题 ,其中 t 0 t_{0} t 0 是 α < t < β \alpha<t<\beta α < t < β 中的给定点 ,而 x 0 \mathbf{x}^{0} x 0 是给定的初始向量 ,只需选择方程 (6) 中的向量 c \mathbf{c} c 以满足初始条件 (7)。因此,c \mathbf{c} c 必须满足
Ψ ( t 0 ) c = x 0 . \begin{equation*}
\boldsymbol{\Psi}\left(t_{0}\right) \mathbf{c}=\mathbf{x}^{0} . \tag{8}
\end{equation*}
Ψ ( t 0 ) c = x 0 . ( 8 )
因此,由于 Ψ ( t 0 ) \boldsymbol{\Psi}\left(t_{0}\right) Ψ ( t 0 ) 是非奇异 的,
c = Ψ − 1 ( t 0 ) x 0 \begin{equation*}
\mathbf{c}=\boldsymbol{\Psi}^{-1}\left(t_{0}\right) \mathbf{x}^{0} \tag{9}
\end{equation*}
c = Ψ − 1 ( t 0 ) x 0 ( 9 )
并且
x = Ψ ( t ) Ψ − 1 ( t 0 ) x 0 \begin{equation*}
\mathbf{x}=\boldsymbol{\Psi}(t) \Psi^{-1}\left(t_{0}\right) \mathbf{x}^{0} \tag{10}
\end{equation*}
x = Ψ ( t ) Ψ − 1 ( t 0 ) x 0 ( 10 )
是初始值问题 (1), (7) 的解 。但是,我们强调,为了解决给定的初始值问题 ,我们通常会通过行约简 求解方程 (8),然后在方程 (6) 中代入 c \mathbf{c} c ,而不是计算 Ψ − 1 ( t 0 ) \Psi^{-1}\left(t_{0}\right) Ψ − 1 ( t 0 ) 并使用方程 (10)。
回想一下,基本矩阵 Ψ \Psi Ψ 的每一列 都是方程 (1) 的解 。由此得出 Ψ \boldsymbol{\Psi} Ψ 满足矩阵微分方程
Ψ ′ = P ( t ) Ψ \begin{equation*}
\boldsymbol{\Psi}^{\prime}=\mathbf{P}(t) \Psi \tag{11}
\end{equation*}
Ψ ′ = P ( t ) Ψ ( 11 )
通过逐列 比较方程 (11) 的两边,可以很容易地证实这种关系 。
有时,使用特殊的的基本矩阵 (用 Φ ( t ) \Phi(t) Φ ( t ) 表示)会比较方便,该矩阵 的列 是定理 7.4.4 中指定的向量 x ( 1 ) ( t ) , … , x ( n ) ( t ) \mathbf{x}^{(1)}(t), \ldots, \mathbf{x}^{(n)}(t) x ( 1 ) ( t ) , … , x ( n ) ( t ) 。除了微分方程 (1) 之外,这些向量 还满足初始条件
x ( j ) ( t 0 ) = e ( j ) \begin{equation*}
\mathbf{x}^{(j)}\left(t_{0}\right)=\mathbf{e}^{(j)} \tag{12}
\end{equation*}
x ( j ) ( t 0 ) = e ( j ) ( 12 )
其中 e ( j ) \mathbf{e}^{(j)} e ( j ) 是定理 7.4.4 中定义的单位向量 ,在第 j th j^{\text {th }} j th 个位置 为 1,其他位置 为零。因此,Φ ( t ) \boldsymbol{\Phi}(t) Φ ( t ) 具有以下属性 :
Φ ( t 0 ) = ( 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋮ ⋮ 0 0 ⋯ 1 ) = I (13) \Phi\left(t_{0}\right)=\left(\begin{array}{cccc}
1 & 0 & \cdots & 0 \tag{13}\\
0 & 1 & \cdots & 0 \\
\vdots & \vdots & & \vdots \\
0 & 0 & \cdots & 1
\end{array}\right)=\mathbf{I}
Φ ( t 0 ) = 1 0 ⋮ 0 0 1 ⋮ 0 ⋯ ⋯ ⋯ 0 0 ⋮ 1 = I ( 13 )
我们将始终保留符号 Φ \Phi Φ 来表示满足初始条件 (13) 的基本矩阵 ,并在需要任意基本矩阵 时使用 Ψ \Psi Ψ 。用 Φ ( t ) \Phi(t) Φ ( t ) 表示,初始值问题 (1), (7) 的解 看起来甚至更简单;因为 Φ − 1 ( t 0 ) = I \Phi^{-1}\left(t_{0}\right)=\mathbf{I} Φ − 1 ( t 0 ) = I ,所以从方程 (10) 可以得出
x = Φ ( t ) x 0 \begin{equation*}
\mathbf{x}=\boldsymbol{\Phi}(t) \mathbf{x}^{0} \tag{14}
\end{equation*}
x = Φ ( t ) x 0 ( 14 )
虽然基解矩阵 Φ ( t ) \boldsymbol{\Phi}(t) Φ ( t ) 通常比 Ψ ( t ) \boldsymbol{\Psi}(t) Ψ ( t ) 更复杂,但如果要反复求解具有许多不同初始条件 的同一微分方程组 ,它特别有用。这对应于一个给定的物理系统 ,可以从许多不同的初始状态 启动。如果已经确定了基解矩阵 Φ ( t ) \boldsymbol{\Phi}(t) Φ ( t ) ,那么可以通过简单的矩阵乘法 找到每组初始条件 的解 ,如公式 (14) 所示。因此,矩阵 Φ ( t ) \Phi(t) Φ ( t ) 表示将初始条件 x 0 \mathbf{x}^{0} x 0 变换为任意时间 t t t 时的解 x ( t ) \mathbf{x}(t) x ( t ) 。比较公式 (10) 和 (14) 可以清楚地看出 Φ ( t ) = Ψ ( t ) Ψ − 1 ( t 0 ) \boldsymbol{\Phi}(t)=\boldsymbol{\Psi}(t) \boldsymbol{\Psi}^{-1}\left(t_{0}\right) Φ ( t ) = Ψ ( t ) Ψ − 1 ( t 0 ) 。
示例 2
对于示例 1 中的系统 (3)
x ′ = ( 1 1 4 1 ) x \mathbf{x}^{\prime}=\left(\begin{array}{ll}
1 & 1 \\
4 & 1
\end{array}\right) \mathbf{x}
x ′ = ( 1 4 1 1 ) x
求基解矩阵fundamental matrix Φ \Phi Φ ,使得 Φ ( 0 ) = I \boldsymbol{\Phi}(0)=\mathbf{I} Φ ( 0 ) = I 。
解 :
Φ \boldsymbol{\Phi} Φ 的列 是方程 (3) 的解 ,满足初始条件
x ( 1 ) ( 0 ) = ( 1 0 ) , x ( 2 ) ( 0 ) = ( 0 1 ) \begin{equation*}
\mathbf{x}^{(1)}(0)=\binom{1}{0}, \quad \mathbf{x}^{(2)}(0)=\binom{0}{1} \tag{15}
\end{equation*}
x ( 1 ) ( 0 ) = ( 0 1 ) , x ( 2 ) ( 0 ) = ( 1 0 ) ( 15 )
由于方程 (3) 的通解 是
x = c 1 ( 1 2 ) e 3 t + c 2 ( 1 − 2 ) e − t , \mathbf{x}=c_{1}\binom{1}{2} e^{3 t}+c_{2}\binom{1}{-2} e^{-t},
x = c 1 ( 2 1 ) e 3 t + c 2 ( − 2 1 ) e − t ,
我们可以通过选择 c 1 = c 2 = 1 2 c_{1}=c_{2}=\frac{1}{2} c 1 = c 2 = 2 1 来找到满足第一组初始条件 的解 ;类似地,通过选择 c 1 = 1 4 c_{1}=\frac{1}{4} c 1 = 4 1 和 c 2 = − 1 4 c_{2}=-\frac{1}{4} c 2 = − 4 1 来获得满足第二组初始条件 的解 。因此
Φ ( t ) = ( 1 2 e 3 t + 1 2 e − t 1 4 e 3 t − 1 4 e − t e 3 t − e − t 1 2 e 3 t + 1 2 e − t ) (16) \boldsymbol{\Phi}(t)=\left(\begin{array}{ll}
\frac{1}{2} e^{3 t}+\frac{1}{2} e^{-t} & \frac{1}{4} e^{3 t}-\frac{1}{4} e^{-t} \tag{16}\\
e^{3 t}-e^{-t} & \frac{1}{2} e^{3 t}+\frac{1}{2} e^{-t}
\end{array}\right)
Φ ( t ) = ( 2 1 e 3 t + 2 1 e − t e 3 t − e − t 4 1 e 3 t − 4 1 e − t 2 1 e 3 t + 2 1 e − t ) ( 16 )
请注意,Φ ( t ) \boldsymbol{\Phi}(t) Φ ( t ) 的元素 比公式 (4) 给出的基解矩阵 Ψ ( t ) \boldsymbol{\Psi}(t) Ψ ( t ) 的元素 更复杂;但是,现在很容易确定对应于任何一组初始条件 的解 。
矩阵 exp ( A t ) \exp (\mathbf{A} t) exp ( A t ) 。回顾一下,标量初值问题
x ′ = a x , x ( 0 ) = x 0 , \begin{equation*}
x^{\prime}=a x, \quad x(0)=x_{0}, \tag{17}
\end{equation*}
x ′ = a x , x ( 0 ) = x 0 , ( 17 )
其中 a a a 是一个常数 ,其解 为
x = x 0 exp ( a t ) \begin{equation*}
x=x_{0} \exp (a t) \tag{18}
\end{equation*}
x = x 0 exp ( a t ) ( 18 )
现在考虑 n × n n \times n n × n 系统 的相应初值问题 ,即
x ′ = A x , x ( 0 ) = x 0 , \begin{equation*}
\mathbf{x}^{\prime}=\mathbf{A} \mathbf{x}, \quad \mathbf{x}(0)=\mathbf{x}^{0}, \tag{19}
\end{equation*}
x ′ = Ax , x ( 0 ) = x 0 , ( 19 )
其中 A \mathbf{A} A 是一个常数矩阵 。将本节 的结果 应用于初值问题 (19),我们可以将其解 写为
x = Φ ( t ) x 0 \begin{equation*}
\mathbf{x}=\boldsymbol{\Phi}(t) \mathbf{x}^{0} \tag{20}
\end{equation*}
x = Φ ( t ) x 0 ( 20 )
其中 Φ ( 0 ) = I \boldsymbol{\Phi}(0)=\mathbf{I} Φ ( 0 ) = I 。比较初值问题 (17) 和 (19) 及其解 (18) 和 (20),表明矩阵 Φ ( t ) \boldsymbol{\Phi}(t) Φ ( t ) 可能具有指数特征 。现在我们来探讨这种可能性 。
标量指数函数 exp ( a t ) \exp (a t) exp ( a t ) 可以用幂级数 表示
exp ( a t ) = 1 + ∑ n = 1 ∞ a n t n n ! = 1 + a t + a 2 t 2 2 ! + ⋯ + a n t n n ! + ⋯ , \begin{equation*}
\exp (a t)=1+\sum_{n=1}^{\infty} \frac{a^{n} t^{n}}{n!}=1+a t+\frac{a^{2} t^{2}}{2!}+\cdots+\frac{a^{n} t^{n}}{n!}+\cdots, \tag{21}
\end{equation*}
exp ( a t ) = 1 + n = 1 ∑ ∞ n ! a n t n = 1 + a t + 2 ! a 2 t 2 + ⋯ + n ! a n t n + ⋯ , ( 21 )
该级数 对所有 t t t 都收敛。现在让我们用 n × n n \times n n × n 常数矩阵 A \mathbf{A} A 替换标量 a a a ,用 n × n n \times n n × n 单位矩阵 I \mathbf{I} I 替换标量 1,并考虑相应的级数
I + ∑ n = 1 ∞ A n t n n ! = I + A t + A 2 t 2 2 ! + ⋯ + A n t n n ! + ⋯ \begin{equation*}
\mathbf{I}+\sum_{n=1}^{\infty} \frac{\mathbf{A}^{n} t^{n}}{n!}=\mathbf{I}+\mathbf{A} t+\frac{\mathbf{A}^{2} t^{2}}{2!}+\cdots+\frac{\mathbf{A}^{n} t^{n}}{n!}+\cdots \tag{22}
\end{equation*}
I + n = 1 ∑ ∞ n ! A n t n = I + A t + 2 ! A 2 t 2 + ⋯ + n ! A n t n + ⋯ ( 22 )
级数 (22) 中的每一项都是一个 n × n n \times n n × n 矩阵 。可以证明,当 n → ∞ n \rightarrow \infty n → ∞ 时,该矩阵 和的每个元素 都对所有 t t t 收敛。因此,级数 (22) 定义了一个新矩阵 作为其和,我们用 exp ( A t ) \exp (\mathbf{A} t) exp ( A t ) 表示;也就是说,
exp ( A t ) = I + ∑ n = 1 ∞ A n t n n ! \begin{equation*}
\exp (\mathbf{A} t)=\mathbf{I}+\sum_{n=1}^{\infty} \frac{\mathbf{A}^{n} t^{n}}{n!} \tag{23}
\end{equation*}
exp ( A t ) = I + n = 1 ∑ ∞ n ! A n t n ( 23 )
类似于标量函数 exp ( a t ) \exp (a t) exp ( a t ) 的展开式 (21)。
通过对级数 (23) 逐项求导,我们得到
d d t exp ( A t ) = ∑ n = 1 ∞ A n t n − 1 ( n − 1 ) ! = A ( I + ∑ n = 1 ∞ A n t n n ! ) = A exp ( A t ) \begin{equation*}
\frac{d}{d t} \exp (\mathbf{A} t)=\sum_{n=1}^{\infty} \frac{\mathbf{A}^{n} t^{n-1}}{(n-1)!}=\mathbf{A}\left(\mathbf{I}+\sum_{n=1}^{\infty} \frac{\mathbf{A}^{n} t^{n}}{n!}\right)=\mathbf{A} \exp (\mathbf{A} t) \tag{24}
\end{equation*}
d t d exp ( A t ) = n = 1 ∑ ∞ ( n − 1 )! A n t n − 1 = A ( I + n = 1 ∑ ∞ n ! A n t n ) = A exp ( A t ) ( 24 )
因此,exp ( A t ) \exp (\mathbf{A} t) exp ( A t ) 满足微分方程
d d t exp ( A t ) = A exp ( A t ) \begin{equation*}
\frac{d}{d t} \exp (\mathbf{A} t)=\mathbf{A} \exp (\mathbf{A} t) \tag{25}
\end{equation*}
d t d exp ( A t ) = A exp ( A t ) ( 25 )
此外,通过在公式 (23) 中设置 t = 0 t=0 t = 0 ,我们发现 exp ( A t ) \exp (\mathbf{A} t) exp ( A t ) 满足初始条件
exp ( A t ) ∣ t = 0 = I + ∑ n = 1 ∞ A n 0 n n ! = I \begin{equation*}
\left.\exp (\mathbf{A} t)\right|_{t=0}=\mathbf{I}+\sum_{n=1}^{\infty} \frac{\mathbf{A}^{n} 0^{n}}{n!}=\mathbf{I} \tag{26}
\end{equation*}
exp ( A t ) ∣ t = 0 = I + n = 1 ∑ ∞ n ! A n 0 n = I ( 26 )
基本矩阵 Φ \boldsymbol{\Phi} Φ 满足与 exp ( A t ) \exp (\mathbf{A} t) exp ( A t ) 相同的初值问题 ,即,
Φ ′ = A Φ , Φ ( 0 ) = I \begin{equation*}
\Phi^{\prime}=\mathbf{A} \Phi, \quad \Phi(0)=\mathbf{I} \tag{27}
\end{equation*}
Φ ′ = A Φ , Φ ( 0 ) = I ( 27 )
然后,根据定理 7.1.2 的唯一性部分 (扩展到矩阵微分方程 ),我们得出结论:exp ( A t ) \exp (\mathbf{A} t) exp ( A t ) 和基本矩阵 Φ ( t ) \boldsymbol{\Phi}(t) Φ ( t ) 是相同的。因此,我们可以将初值问题 (19) 的解 写成如下形式:
x = exp ( A t ) x 0 \begin{equation*}
\mathbf{x}=\exp (\mathbf{A} t) \mathbf{x}^{0} \tag{28}
\end{equation*}
x = exp ( A t ) x 0 ( 28 )
这类似于初值问题 (17) 的解 (18)。为了更有说服力地证明使用 exp ( A t ) \exp (\mathbf{A} t) exp ( A t ) 来表示级数 (22) 的和,我们应该证明这个矩阵函数 确实具有我们与指数函数 相关联的性质 。问题 12 中概述了一种方法 可以做到这一点。
可对角化矩阵 。线性 (代数 或微分 )方程组 出现一些困难 的基本原因 是这些方程 通常是耦合的。换句话说,一些或所有方程 都包含多个——通常是全部——未知变量 。因此,必须同时求解系统 中的方程 。相反,如果每个方程 只涉及单个变量 ,那么每个方程 都可以独立于所有其他方程 求解,这是一个容易得多的任务 。这个观察结果 表明,解决方程组 的一种方法 可能是将其转换为等价的非耦合系统 ,其中每个方程 只包含一个未知变量 。这对应于将系数矩阵 A \mathbf{A} A 转换为对角矩阵 。
特征向量 在完成这种转换中很有用。假设 n × n n \times n n × n 矩阵 A \mathbf{A} A 具有完整的 n n n 个线性无关的特征向量集合 。回想一下,如果 A \mathbf{A} A 的特征值 都不同,或者如果 A \mathbf{A} A 是埃尔米特矩阵 ,那么肯定会是这种情况。令 ξ ( 1 ) , … , ξ ( n ) \boldsymbol{\xi}^{(1)}, \ldots, \boldsymbol{\xi}^{(n)} ξ ( 1 ) , … , ξ ( n ) 表示这些特征向量 ,λ 1 , … , λ n \lambda_{1}, \ldots, \lambda_{n} λ 1 , … , λ n 表示相应的特征值 ,形成矩阵 T \mathbf{T} T ,其列 是特征向量 ——即,
T = ( ξ 1 ( 1 ) ⋯ ξ 1 ( n ) ⋮ ⋮ ξ n ( 1 ) ⋯ ξ n ( n ) ) (29) \mathbf{T}=\left(\begin{array}{ccc}
\xi_{1}^{(1)} & \cdots & \xi_{1}^{(n)} \tag{29}\\
\vdots & & \vdots \\
\xi_{n}^{(1)} & \cdots & \xi_{n}^{(n)}
\end{array}\right)
T = ξ 1 ( 1 ) ⋮ ξ n ( 1 ) ⋯ ⋯ ξ 1 ( n ) ⋮ ξ n ( n ) ( 29 )
由于 T \mathbf{T} T 的列 是线性无关的向量 ,所以 det T ≠ 0 \operatorname{det} \mathbf{T} \neq 0 det T = 0 ;因此 T \mathbf{T} T 是非奇异的,T − 1 \mathbf{T}^{-1} T − 1 存在。一个简单的计算 表明,矩阵 AT 的列 恰好是向量 A ξ ( 1 ) , … , A ξ ( n ) \mathbf{A} \boldsymbol{\xi}^{(1)}, \ldots, \mathbf{A} \boldsymbol{\xi}^{(n)} A ξ ( 1 ) , … , A ξ ( n ) 。由于 A ξ ( k ) = λ k ξ ( k ) \mathbf{A} \boldsymbol{\xi}^{(k)}=\lambda_{k} \boldsymbol{\xi}^{(k)} A ξ ( k ) = λ k ξ ( k ) ,因此有
A T = ( λ 1 ξ 1 ( 1 ) ⋯ λ n ξ 1 ( n ) ⋮ ⋮ λ 1 ξ n ( 1 ) ⋯ λ n ξ n ( n ) ) = T D (30) \mathbf{A T}=\left(\begin{array}{ccc}
\lambda_{1} \xi_{1}^{(1)} & \cdots & \lambda_{n} \xi_{1}^{(n)} \tag{30}\\
\vdots & & \vdots \\
\lambda_{1} \xi_{n}^{(1)} & \cdots & \lambda_{n} \xi_{n}^{(n)}
\end{array}\right)=\mathbf{T D}
AT = λ 1 ξ 1 ( 1 ) ⋮ λ 1 ξ n ( 1 ) ⋯ ⋯ λ n ξ 1 ( n ) ⋮ λ n ξ n ( n ) = TD ( 30 )
其中
D = ( λ 1 0 ⋯ 0 0 λ 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ λ n ) (31) \mathbf{D}=\left(\begin{array}{cccc}
\lambda_{1} & 0 & \cdots & 0 \tag{31}\\
0 & \lambda_{2} & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & \lambda_{n}
\end{array}\right)
D = λ 1 0 ⋮ 0 0 λ 2 ⋮ 0 ⋯ ⋯ ⋱ ⋯ 0 0 ⋮ λ n ( 31 )
是一个对角矩阵 ,其对角元素 是 A \mathbf{A} A 的特征值 。从方程 (30) 可以得出
T − 1 A T = D \begin{equation*}
\mathbf{T}^{-1} \mathbf{A} \mathbf{T}=\mathbf{D} \tag{32}
\end{equation*}
T − 1 AT = D ( 32 )
因此,如果已知 A \mathbf{A} A 的特征值 和特征向量 ,则可以通过方程 (32) 所示的过程 将 A \mathbf{A} A 转换为对角矩阵 。此过程 称为相似变换 ,方程 (32) 用以下话语 总结:A \mathbf{A} A 类似于对角矩阵 D \mathbf{D} D 。或者,我们可以说 A \mathbf{A} A 是可对角化的。观察到相似变换 不会改变 A \mathbf{A} A 的特征值 ,并将它的特征向量 变换为坐标向量 e ( 1 ) , … , e ( n ) \mathbf{e}^{(1)}, \ldots, \mathbf{e}^{(n)} e ( 1 ) , … , e ( n ) 。
如果 A \mathbf{A} A 是埃尔米特矩阵 ,那么 T − 1 \mathbf{T}^{-1} T − 1 的确定非常简单。已知 A \mathbf{A} A 的特征向量 ξ ( 1 ) , … , ξ ( n ) \boldsymbol{\xi}^{(1)}, \ldots, \boldsymbol{\xi}^{(n)} ξ ( 1 ) , … , ξ ( n ) 彼此正交,所以让我们选择它们,使它们也通过 ( ξ ( i ) , ξ ( i ) ) = 1 \left(\boldsymbol{\xi}^{(i)}, \boldsymbol{\xi}^{(i)}\right)=1 ( ξ ( i ) , ξ ( i ) ) = 1 对于每个 i i i 进行了归一化。然后很容易验证 T − 1 = T ∗ \mathbf{T}^{-1}=\mathbf{T}^{*} T − 1 = T ∗ ;换句话说,T \mathbf{T} T 的逆矩阵 与其伴随矩阵 (其复共轭的转置)相同。
最后,我们注意到,如果 A \mathbf{A} A 具有少于 n n n 个线性无关的特征向量 ,则不存在矩阵 T \mathbf{T} T 使得 T − 1 A T = D \mathbf{T}^{-1} \mathbf{A T}=\mathbf{D} T − 1 AT = D 。在这种情况下,A \mathbf{A} A 不相似于对角矩阵 ,并且不可对角化。这种情况将在第 7.8 节中进行更详细的讨论。
示例 3
考虑矩阵
A = ( 1 1 4 1 ) (33) \mathbf{A}=\left(\begin{array}{ll}
1 & 1 \tag{33}\\
4 & 1
\end{array}\right)
A = ( 1 4 1 1 ) ( 33 )
求相似变换矩阵 T \mathbf{T} T 并证明 A \mathbf{A} A 可以对角化。
解 :
在第 7.5 节的示例 2 中,我们发现 A \mathbf{A} A 的特征值 和特征向量 为
r 1 = 3 , ξ ( 1 ) = ( 1 2 ) 并且 r 2 = − 1 , ξ ( 2 ) = ( 1 − 2 ) . \begin{equation*}
r_{1}=3, \quad \xi^{(1)}=\binom{1}{2} \quad \text { 并且 } \quad r_{2}=-1, \quad \xi^{(2)}=\binom{1}{-2} . \tag{34}
\end{equation*}
r 1 = 3 , ξ ( 1 ) = ( 2 1 ) 并且 r 2 = − 1 , ξ ( 2 ) = ( − 2 1 ) . ( 34 )
因此,变换矩阵 T \mathbf{T} T 及其逆矩阵 T − 1 \mathbf{T}^{-1} T − 1 为
T = ( 1 1 2 − 2 ) 并且 T − 1 = ( 1 2 1 4 1 2 − 1 4 ) . (35) \mathbf{T}=\left(\begin{array}{rr}
1 & 1 \tag{35}\\
2 & -2
\end{array}\right) \quad \text { 并且 } \quad \mathbf{T}^{-1}=\left(\begin{array}{rr}
\frac{1}{2} & \frac{1}{4} \\
\frac{1}{2} & -\frac{1}{4}
\end{array}\right) .
T = ( 1 2 1 − 2 ) 并且 T − 1 = ( 2 1 2 1 4 1 − 4 1 ) . ( 35 )
因此,您可以验证
T − 1 A T = ( 3 0 0 − 1 ) = D . (36) \mathbf{T}^{-1} \mathbf{A T}=\left(\begin{array}{rr}
3 & 0 \tag{36}\\
0 & -1
\end{array}\right)=\mathbf{D} .
T − 1 AT = ( 3 0 0 − 1 ) = D . ( 36 )
现在让我们再次转向系统
x ′ = A x \begin{equation*}
\mathbf{x}^{\prime}=\mathbf{A} \mathbf{x} \tag{37}
\end{equation*}
x ′ = Ax ( 37 )
其中 A \mathbf{A} A 是一个常数矩阵 。在第 7.5 节和第 7.6 节中,我们描述了如何通过从假设 x = ξ e r t \mathbf{x}=\xi e^{r t} x = ξ e r t 出发来求解这样的系统 。现在我们提供另一种观点 ,一种基于对角化系数矩阵 A \mathbf{A} A 的观点 。
根据本节前面陈述的结果 ,只要 A \mathbf{A} A 具有完整的 n n n 个线性无关的特征向量集合 ,就可以对角化 A \mathbf{A} A 。令 ξ ( 1 ) , … , ξ ( n ) \boldsymbol{\xi}^{(1)}, \ldots, \boldsymbol{\xi}^{(n)} ξ ( 1 ) , … , ξ ( n ) 是 A \mathbf{A} A 对应于特征值 r 1 ⋯ , r n r_{1} \cdots, r_{n} r 1 ⋯ , r n 的特征向量 ,并形成变换矩阵 T \mathbf{T} T ,其列 为 ξ ( 1 ) , … , ξ ( n ) \boldsymbol{\xi}^{(1)}, \ldots, \boldsymbol{\xi}^{(n)} ξ ( 1 ) , … , ξ ( n ) 。然后,通过关系式
x = T y \begin{equation*}
\mathbf{x}=\mathbf{T y} \tag{38}
\end{equation*}
x = Ty ( 38 )
定义一个新的因变量 y \mathbf{y} y ,我们从方程 (37) 得到
T y ′ = A T y \begin{equation*}
\mathbf{T y}^{\prime}=\mathbf{A} \mathbf{T} \mathbf{y} \tag{39}
\end{equation*}
Ty ′ = ATy ( 39 )
乘以 T − 1 \mathbf{T}^{-1} T − 1 ,我们得到
y ′ = ( T − 1 A T ) y \begin{equation*}
\mathbf{y}^{\prime}=\left(\mathbf{T}^{-1} \mathbf{A} \mathbf{T}\right) \mathbf{y} \tag{40}
\end{equation*}
y ′ = ( T − 1 AT ) y ( 40 )
或者,使用方程 (32),
y ′ = D y \begin{equation*}
\mathbf{y}^{\prime}=\mathbf{D y} \tag{41}
\end{equation*}
y ′ = Dy ( 41 )
回想一下,D \mathbf{D} D 是对角矩阵 ,其对角线上是 A \mathbf{A} A 的特征值 r 1 , … , r n r_{1}, \ldots, r_{n} r 1 , … , r n 。系统 (41) 的一个基本矩阵 是对角矩阵 (参见问题 13)
( e r 1 t 0 … 0 0 e r 2 t … 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ e r n t ) (42) \begin{pmatrix}
e^{r_1 t} & 0 & \ldots & 0 \\
0 & e^{r_2 t} & \ldots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & e^{r_n t}
\end{pmatrix}
\tag{42}
e r 1 t 0 ⋮ 0 0 e r 2 t ⋮ 0 … … ⋱ ⋯ 0 0 ⋮ e r n t ( 42 )
然后,通过变换 (38) 从 Q \mathbf{Q} Q 找到系统 (37) 的基本矩阵 Ψ \boldsymbol{\Psi} Ψ
Ψ = T Q \begin{equation*}
\Psi=\mathbf{T Q} \tag{43}
\end{equation*}
Ψ = TQ ( 43 )
也就是说,
Ψ ( t ) = ( ξ 1 ( 1 ) e r 1 t ⋯ ξ 1 ( n ) e r n t ⋮ ⋮ ξ n ( 1 ) e r 1 t ⋯ ξ n ( n ) e r n t ) (44) \Psi(t)=\left(\begin{array}{ccc}
\xi_{1}^{(1)} e^{r_{1} t} & \cdots & \xi_{1}^{(n)} e^{r_{n} t} \tag{44}\\
\vdots & & \vdots \\
\xi_{n}^{(1)} e^{r_{1} t} & \cdots & \xi_{n}^{(n)} e^{r_{n} t}
\end{array}\right)
Ψ ( t ) = ξ 1 ( 1 ) e r 1 t ⋮ ξ n ( 1 ) e r 1 t ⋯ ⋯ ξ 1 ( n ) e r n t ⋮ ξ n ( n ) e r n t ( 44 )
Ψ ( t ) \boldsymbol{\Psi}(t) Ψ ( t ) 的列 与第 7.5 节 的方程 (27) 中的解 相同。因此,对角化过程 并没有比第 7.5 节 的方法 提供任何计算 上的优势 ,因为无论哪种情况 ,都需要计算微分方程组 中系数矩阵 的特征值 和特征向量 。
示例 4
再次考虑微分方程组
x ′ = A x , \begin{equation*}
\mathbf{x}^{\prime}=\mathbf{A x}, \tag{45}
\end{equation*}
x ′ = Ax , ( 45 )
其中 A \mathbf{A} A 由方程 (33) 给出。使用变换 x = T y \mathbf{x}=\mathbf{T y} x = Ty ,其中 T \mathbf{T} T 由方程 (35) 给出,系统 (45) 简化为对角系统
y ′ = ( 3 0 0 − 1 ) y = D y (46) \mathbf{y}^{\prime}=\left(\begin{array}{rr}
3 & 0 \tag{46}\\
0 & -1
\end{array}\right) \mathbf{y}=\mathbf{D} \mathbf{y}
y ′ = ( 3 0 0 − 1 ) y = Dy ( 46 )
获得系统 (46) 的基本矩阵 ,然后对其进行变换 以获得原始系统 (45) 的基本矩阵 。
解 :
通过将 D \mathbf{D} D 重复地与其自身相乘,我们发现
D 2 = ( 9 0 0 1 ) , D 3 = ( 27 0 0 − 1 ) , … (47) \mathbf{D}^{2}=\left(\begin{array}{ll}
9 & 0 \tag{47}\\
0 & 1
\end{array}\right), \quad \mathbf{D}^{3}=\left(\begin{array}{rr}
27 & 0 \\
0 & -1
\end{array}\right), \ldots
D 2 = ( 9 0 0 1 ) , D 3 = ( 27 0 0 − 1 ) , … ( 47 )
因此,从方程 (23) 可以得出,exp ( D t ) \exp (\mathbf{D} t) exp ( D t ) 是一个对角矩阵 ,对角线 上的元素 为 e 3 t e^{3 t} e 3 t 和 e − t e^{-t} e − t ;也就是说,
e D t = ( e 3 t 0 0 e − t ) (48) e^{\mathbf{D} t}=\left(\begin{array}{rr}
e^{3 t} & 0 \tag{48}\\
0 & e^{-t}
\end{array}\right)
e D t = ( e 3 t 0 0 e − t ) ( 48 )
最后,通过将 T \mathbf{T} T 和 exp ( D t ) \exp (\mathbf{D} t) exp ( D t ) 相乘,我们得到所需要的基解矩阵 Ψ ( t ) \boldsymbol{\Psi}(t) Ψ ( t ) :
Ψ ( t ) = ( 1 1 2 − 2 ) ( e 3 t 0 0 e − t ) = ( e 3 t e − t 2 e 3 t − 2 e − t ) (49) \Psi(t)=\left(\begin{array}{rr}
1 & 1 \tag{49}\\
2 & -2
\end{array}\right)\left(\begin{array}{rr}
e^{3 t} & 0 \\
0 & e^{-t}
\end{array}\right)=\left(\begin{array}{rr}
e^{3 t} & e^{-t} \\
2 e^{3 t} & -2 e^{-t}
\end{array}\right)
Ψ ( t ) = ( 1 2 1 − 2 ) ( e 3 t 0 0 e − t ) = ( e 3 t 2 e 3 t e − t − 2 e − t ) ( 49 )
观察到,这个基解矩阵 与例 1中找到的相同。